智能论文笔记

Deep Reinforcement Learning for Heat Pump Control

Tobias Rohrer , Lilli Frison , Lukas Kaupenjohann , Katrin Scharf , Elke Hergenrother

分类：机器学习 | 人工智能

2022-12-24

Heating in private households is a major contributor to the emissions generated today. Heat pumps are a promising alternative for heat generation and are a key technology in achieving our goals of the German energy transformation and to become less dependent on fossil fuels. Today, the majority of heat pumps in the field are controlled by a simple heating curve, which is a naive mapping of the current outdoor temperature to a control action. A more advanced control approach is model predictive control (MPC) which was applied in multiple research works to heat pump control. However, MPC is heavily dependent on the building model, which has several disadvantages. Motivated by this and by recent breakthroughs in the field, this work applies deep reinforcement learning (DRL) to heat pump control in a simulated environment. Through a comparison to MPC, it could be shown that it is possible to apply DRL in a model-free manner to achieve MPC-like performance. This work extends other works which have already applied DRL to building heating operation by performing an in-depth analysis of the learned control strategies and by giving a detailed comparison of the two state-of-the-art control methods.

translated by 谷歌翻译

Managing Large Dataset Gaps in Urban Air Quality Prediction: DCU-Insight-AQ at MediaEval 2022

Dinh Viet Cuong , Phuc H. Le-Khac , Adam Stapleton , Elke Eichlemann , Mark Roantree , Alan F. Smeaton

分类：机器学习 | 人工智能

2022-12-19

Calculating an Air Quality Index (AQI) typically uses data streams from air quality sensors deployed at fixed locations and the calculation is a real time process. If one or a number of sensors are broken or offline, then the real time AQI value cannot be computed. Estimating AQI values for some point in the future is a predictive process and uses historical AQI values to train and build models. In this work we focus on gap filling in air quality data where the task is to predict the AQI at 1, 5 and 7 days into the future. The scenario is where one or a number of air, weather and traffic sensors are offline and explores prediction accuracy under such situations. The work is part of the MediaEval'2022 Urban Air: Urban Life and Air Pollution task submitted by the DCU-Insight-AQ team and uses multimodal and crossmodal data consisting of AQI, weather and CCTV traffic images for air pollution prediction.

translated by 谷歌翻译

Stop&Hop: Early Classification of Irregular Time Series

Thomas Hartvigsen , Walter Gerych , Jidapa Thadajarassiri , Xiangnan Kong , Elke Rundensteiner

分类：机器学习

2022-08-21

早期分类算法可帮助用户对机器学习模型的预测更快地反应。例如，医院的预警系统使临床医生通过准确预测感染来改善患者的结局。尽管早期分类系统正在迅速发展，但仍然存在一个主要差距：现有系统不考虑不规则的时间序列，这些时间序列之间的观察结果之间存在不平衡且经常长的差距。众所周知，这种系列在医疗保健等有影响力的领域中普遍存在。我们弥合了这一差距，并研究了不规则时间序列的早期分类，这是早期分类器的新环境，它为更真实的问题打开了大门。我们的解决方案“停止＆Hop”使用连续的重复网络实时建模正在进行的不规则时间序列，而不规则的停止策略接受了加强学习的培训，可以预测何时停止和对流媒体系列进行分类。通过采用实价阶梯尺寸，停止策略可以灵活地决定何时实时停止持续的系列。这样，停止和HOP无缝地集成了观测时间安排中包含的信息，这是在这种情况下进行早期分类的新的至关重要的来源，并与时间序列值一起为不规则时间序列提供早期分类。使用四个合成和三个现实世界数据集，我们证明，与适应这个新问题的最新替代方案相比，停止和跳跃始终如一地做出更早，更准确的预测。我们的代码可在https://github.com/thartvigsen/stopandhop上公开获取。

translated by 谷歌翻译

MANI-Rank: Multiple Attribute and Intersectional Group Fairness for Consensus Ranking

Kathleen Cachel , Elke Rundensteiner , Lane Harrison

分类：机器学习

2022-07-20

将许多排名者的偏好结合到一个单一共识排名中对于从招聘和入学到贷款的结果应用至关重要。尽管已经对群体公平进行分类进行了广泛的研究，但排名，尤其是等级聚集的群体公平仍处于起步阶段。最近的工作介绍了合并排名的公平等级聚合的概念，但仅限于候选人具有单个二进制保护属性的情况，即仅分为两组。然而，如何建立共识排名仍然是一个开放的问题，该排名代表了所有排名者的偏好，同时确保对具有多个受保护属性的候选人（例如性别，种族和国籍）进行公平待遇。在这项工作中，我们是第一个定义和解决此开放的多属性公平共识排名（MFCR）问题的人。作为基础，我们为名为Mani-Rank的排名设计了新颖的团体公平标准，以确保对由个体受保护属性及其交集定义的群体进行公平处理。利用摩尼级标准，我们开发了一系列算法，这些算法首次解决了MFCR问题。我们对各种共识情景的实验研究表明，我们的MFCR方法是实现交叉和受保护属性公平性的唯一方法，同时也代表了通过许多基本排名表达的偏好。我们对绩效奖学金的现实案例研究说明了我们的MFCR方法对减轻多个受保护属性及其交叉点的偏见的有效性。这是出现在ICDE 2022中的“ Mani-Rank：Mani-Rank：多个属性和交叉组公平性”的扩展版本。

translated by 谷歌翻译

DeepEmotex: Classifying Emotion in Text Messages using Deep Transfer Learning

Maryam Hasan , Elke Rundensteiner , Emmanuel Agu

分类：机器学习

2022-06-12

转移学习已通过深度审慎的语言模型广泛用于自然语言处理，例如来自变形金刚和通用句子编码器的双向编码器表示。尽管取得了巨大的成功，但语言模型应用于小型数据集时会过多地适合，并且很容易忘记与分类器进行微调时。为了解决这个忘记将深入的语言模型从一个域转移到另一个领域的问题，现有的努力探索了微调方法，以减少忘记。我们建议DeepeMotex是一种有效的顺序转移学习方法，以检测文本中的情绪。为了避免忘记问题，通过从Twitter收集的大量情绪标记的数据来仪器进行微调步骤。我们使用策划的Twitter数据集和基准数据集进行了一项实验研究。 DeepeMotex模型在测试数据集上实现多级情绪分类的精度超过91％。我们评估了微调DeepeMotex模型在分类Emoint和刺激基准数据集中的情绪时的性能。这些模型在基准数据集中的73％的实例中正确分类了情绪。所提出的DeepeMotex-Bert模型优于BI-LSTM在基准数据集上的BI-LSTM增长23％。我们还研究了微调数据集的大小对模型准确性的影响。我们的评估结果表明，通过大量情绪标记的数据进行微调提高了最终目标任务模型的鲁棒性和有效性。

translated by 谷歌翻译

TWEET-FID: An Annotated Dataset for Multiple Foodborne Illness Detection Tasks

Ruofan Hu , Dongyu Zhang , Dandan Tao , Thomas Hartvigsen , Hao Feng , Elke Rundensteiner

分类：自然语言处理 | 人工智能 | 机器学习

2022-05-22

食源性疾病是一个严重但可以预防的公共卫生问题 - 延迟发现相关的暴发导致生产力损失，昂贵的召回，公共安全危害甚至生命丧失。尽管社交媒体是识别未报告的食源性疾病的有前途的来源，但缺乏标记的数据集来开发有效的爆发检测模型。为了加快基于机器学习的疫苗爆发检测模型的开发，我们提出了推文-FID（Tweet-Foodborne疾病检测），这是第一个用于多种食源性疾病事件检测任务的公开注释的数据集。从Twitter收集的Tweet-FID带有三个方面：Tweet类，实体类型和老虎机类型，并带有专家以及众包工人生产的标签。我们介绍了利用这三个方面的几个域任务：文本相关性分类（TRC），实体提及检测（EMD）和插槽填充（SF）。我们描述了用于支持这些任务模型开发的数据集设计，创建和标签的端到端方法。提供了这些任务的全面结果，以利用Tweet-FID数据集上的最新单项和多任务深度学习方法。该数据集为未来的Foodborne爆发检测提供了机会。

translated by 谷歌翻译

Causal Inference Through the Structural Causal Marginal Problem

Luigi Gresele , Julius von Kügelgen , Jonas M. Kübler , Elke Kirschbaum , Bernhard Schölkopf , Dominik Janzing

分类：人工智能 | 机器学习

2022-02-02

我们基于从多个数据集的合并信息介绍了一种反事实推断的方法。我们考虑了统计边际问题的因果重新重新制定：鉴于边际结构因果模型（SCM）的集合在不同但重叠的变量集上，请确定与边际相反一致的关节SCMS集。我们使用响应函数配方对分类SCM进行了形式化这种方法，并表明它降低了允许的边际和关节SCM的空间。因此，我们的工作通过其他变量突出了一种通过其他变量的新模式，与统计数据相反。

translated by 谷歌翻译

Multiple Instance Learning for Brain Tumor Detection from Magnetic Resonance Spectroscopy Data

Diyuan Lu , Gerhard Kurz , Nenad Polomac , Iskra Gacheva , Elke Hattingen , Jochen Triesch

分类：机器学习

2021-12-16

我们应用磁共振波谱分析（MRS）深度学习（DL）数据的脑肿瘤检测的任务。医疗方面的应用往往是噪声数据匮乏和腐败困扰。这两个问题是在我们的数据集突出。此外，不同数量的光谱的可用于不同的患者。我们考虑的任务作为多实例学习（MIL）问题，解决这些问题。具体来说，我们聚集来自同一患者的多个光谱成“袋”用于分类和应用数据的增强技术。为了实现装袋的过程中，置换不变性，我们提出了两种方法：（1）申请MIN-，MAX-，和平均汇集所有样本在一个袋子和（2）的功能应用的注意机制。我们测试了多个神经网络结构这两种方法。我们证明上的多个实例的训练，而不是单一的光谱时分类性能显著提高。我们提出了一个简单的过采样数据隆胸方法，并表明它可以进一步提高性能。最后，我们证明了我们提出的模型优于根据大多数性能指标由神经放射学手工分类。

translated by 谷歌翻译